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牛 系统 ， 它 通过 收集 用 户 信息 ， 物 品 信息 以 及 用 户 与 物品 的 ”在 与 物品 交互 的 过 程 中 ， 有 目的 性 地 进行 操作 ， 从 而 干扰 了 正 
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ji] SE: 托 攻击 是 当前 推荐 系统 面临 的 严峻 挑战 之 一 。 由 于 推荐 系统 的 开放 性 ， 恶 意 用 户 可 轻易 对 其 注入 精心 设计 的 
评分 从 而 影响 推荐 结果 ， 降 低 用 户 体验 。 基 于 属性 优化 结构 化 噪声 和 矩阵 补 全 技术 ， 提 出 一 种 鲁 棒 的 抗 托 攻击 个 性 化 推 
荐 (SATPR) 算法 ， 将 攻击 评分 视 为 评分 矩阵 中 的 结构 化 行 噪声 并 采用 Loa 范 数 进行 噪声 建 模 ， 同 时 引入 用 户 与 物品 
的 属性 特征 以 提高 托 攻击 检测 精度 。 实 验 表 明 ，SATPR 算法 在 托 攻击 下 可 取得 比 传统 推荐 算法 更 精确 的 个 性 化 评分 预 
Dip e 

关键 词 : 推荐 系统 ; 托 攻击 ; Ll 范 数 正则 化 ; 属性 特征 

中 图 分 类 号 : TP301.6 ^ doi: 10.3969/j.issn.1001-3695.2017.09.0906 


Shilling-attack-tolerant recommendation algorithm based on 
attribute facilitated matrix completion 


Zhou Yuxuan’, Chen Lei* ^, Zhang Hanfeng? 
(a. School of Computer Science, b. Jiangsu High Technology Research Key Laboratory for Wireless Sensor Networks, Nanjing 
University of Posts & Telecommunications, Nanjing 210003, China) 


Abstract: Shilling attack is one of serious challenges which recommender systems are facing. Malicious users can easily insert 

well-designed ratings into recommender systems to affect recommendation results and decrease user experiences because of the 

openness of recommender systems. This article proposed a robust shilling-attack-tolerant personalized recommendation (SATPR) 
algorithm based on attribution facilitated matrix completion with structural noise technology, regarded the ratings of attack users 

in the rating matrix as structural row noise and modeled them with L2,1-norm. This article also introduced attributive characters 

of users and items to improve the accuracy of detection of shilling-attack. Experimental results showed that SATPR algorithm 

achieved more accurate results of personalized rating prediction than traditional recommendation algorithms under shilling 

attacks. 
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是 所 有 用 户 ， 并 没有 设置 准 入 门槛 ， 这 种 数据 来 源 的 开放 性 导 
致 了 协同 过 滤 推 荐 系统 极 易 受 到 恶意 用 户 的 干扰 ， 这 种 现象 称 
荐 系统 是 一 种 为 托 攻击 (shilling attack)。 攻 击 者 往往 可 以 轻易 伪装 成 普通 用 户 ， 


ill 


引 


四 对 信息 过 载 问 题 ， 推 荐 系统 应 运 而 生 。 
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交互 信息 ， 了 解 用 户 的 偏好 ， 从 而 将 用 户 可 能 感 兴趣 的 物品 扒 常 的 推荐 结果 ， 严 重 影响 了 用 户 体验 。 因 此 ， 抵 御 托 攻击 的 干 


k 


荐 给 用 户 ， 在 一 定 程度 上 解决 困扰 用 户 的 信息 过 载 问题 巾 。 当 扰 ， 增 强 推荐 系统 的 鲁 棒 性 ， 成 为 推荐 系统 的 重要 改进 方向 。 
前 实现 推荐 系统 的 一 种 主流 方法 是 协同 过 滤 (collaborative 通常 情况 下 ， 试 图 区 分 精心 伪装 的 托 攻 击 用 户 与 正常 用 户 
filtering) 方法 。 它 依赖 于 用 户 的 历史 行为 ， 分 析 过 去 的 用 户 - 物 。 是 很 困难 的 。 然 而 ， 从 攻击 意图 ， 攻 击 过 程 等 各 方面 分 析 ， 托 
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品 交 互 ， 建 立新 的 用 户 -物品 联系 中。 协同 过 滤 推 荐 算法 的 推荐 。 ”攻击 概貌 与 正常 用 户 概貌 则 依然 存在 着 细微 差别 。 本 文 针对 用 


疆 果 


结果 与 所 收集 到 的 用 户 -物品 交互 历史 记录 息息相关 , 当 收 集 到 户 - 物 品评 分 矩阵 中 托 攻击 概貌 所 反映 出 的 用 户 偏好 不 够 自然 ， 


n 


的 ) 


户 -物品 交互 数据 越 能 精确 反映 出 用 户 偏 好 与 物品 本 质 , 最 。 异 于 正常 用 户 偏好 这 一 性 质 ， 将 评分 年 阵 中 的 托 攻击 概貌 建 模 


终 的 推荐 结果 也 将 越 精确 。 然 而 , 用户 -物品 交互 数据 的 产生 者 。” ”为 影响 评分 矩阵 低 秩 性 的 结构 化 行 噪声 ， 并 采用 和 矩阵 Lz 范 数 对 
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其 进行 解析 。 除 了 考虑 用 户 概 貌 的 差别 ， 本 文 也 将 用 户 与 物品 
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AFH, F: 基于 属性 优化 矩阵 补 全 的 抗 托 攻击 推荐 


知 攻 击 目标 项 的 基础 上 以 滑动 窗 的 形式 对 用 户 概 貌 进行 排查 ; 
Li 等 人 多 根据 攻击 概貌 中 物品 的 选择 是 基于 人 为 制造 的 规则 ， 


盟 性 信息 纳入 考虑 之 中 ， 进 一 步 提高 了 检测 精度 。 当 检测 出 托 
攻击 用 户 之 后 ， 剔 除 相应 攻击 评分 再 进行 评分 预测 ， 将 显著 增 
强 评分 预测 的 鲁 棒 性 。 基 于 以 上 工作 ， 本 文 提出 了 一 种 基于 属 
性 优化 矩阵 补 全 的 抗 托 攻击 个 性 化 推荐 算法 (SATPR )。 


1 ”相关 工作 


托 攻击 是 当前 推荐 系统 遇 到 的 严峻 挑战 之 一 。 恶 意 商家 或 
用 户 为 了 达成 其 特殊 目的 (往往 是 经 济 利益 )， 冒 充 正常 用 户 ， 


有 悖 于 自然 状态 下 正常 用 户 的 内 在 偏好 这 一 性 质 ， 通 过 挖掘 用 
户 概 貌 中 的 物品 属性 特征 评判 用 户 概貌 ; Deng 等 人 中 提出 了 一 
种 结合 了 主 成 分 分 析 (PCA) 与 扰动 的 无 监督 检测 方法 ， 对 用 户 
概貌 加 入 高 斯 噪声 ， 在 加 入 噪声 前 后 各 做 一 次 PCA， 结 合 两 次 
的 结果 进行 比较 分 析 ， 确 定 托 攻击 用 户 。 

另外 , 由 于 推荐 系统 往往 要 针对 用 户 - 物 品评 分 矩阵 进行 
究 ， 因 此 ， 在 矩阵 补 全 领域 对 于 异常 元 素 的 范 数 正则 化 技术 同 


在 与 物品 交互 的 过 程 中 ， 向 推荐 系统 注入 精心 设计 的 虚假 用 户 
概貌 ， 从 而 干扰 正常 的 推荐 结果 ， 实 现 其 攻击 意图 。 在 一 个 攻 


样 值得 借鉴 。 陈 蓉 等 人 由 对 于 低 秩 矩阵 补 全 在 现实 应 用 中 过 到 
的 采样 数据 可 能 会 受到 结构 化 噪声 污染 的 问题 ， 提 出 了 一 种 利 


击 用 户 概貌 中 ,所 有 物品 的 集合 1 可 被 分 成 四 个 子 集 : 选择 填充 
项 (selected items) 15, HA (filler items) 1^, 目标 项 (target 
items) 和 未 评分 项 Cunrated items) 2。 选 择 填充 项 中 的 物品 
由 攻击 者 刻意 挑选 ， 用 以 接近 特定 目标 用 户 群体 ， 填 充 项 中 的 
鬼 品 通常 是 随机 挑选 的 ， 用 以 隐藏 攻击 者 的 身份 ， 目 标 项 即 被 
H ; 另外 ， 由 于 实际 用 户 不 可 能 对 所 有 物品 进行 
评价 ,这 些 没有 获得 评分 的 物品 构成 未 评分 项 ,根据 攻击 意图 ， 
托 攻击 分 为 推 攻击 (push attack) 与 核 攻 击 (nuke attack) P3, — 46 3 
击 者 致力 于 提升 目标 物品 的 知名 度 ， 从 而 使 推荐 系统 将 其 作为 
推荐 结果 推送 给 用 户 ， 这 种 攻击 称 为 推 攻击 ; 另 一 些 攻 击 者 则 
致力 于 降低 目标 物品 的 知名 度 ， 从 而 使 该 目标 物品 被 推荐 的 可 
能 性 降低 , 这 种 攻击 称 为 核 攻击 。 而 根据 实施 攻击 的 具体 细节 ， 
托 攻击 可 分 为 多 种 攻击 类 型 ， 其 中 最 常见 的 三 种 攻击 模型 分 别 
是 随机 攻击 (random attack)， 均 值 攻 击 〈average attack) 和 流 
行 攻 击 (bandwagon attack )， 各 攻击 模型 之 间 的 区 别 主要 在 于 
攻击 用 户 概貌 所 采用 的 构造 规则 不 同 。 在 随机 攻击 中 ， 攻 击 概 
貌 没 有 选择 填充 项 ， 填 充 项 随机 选择 物品 ， 并 根据 全 体 物 品 平 
均 分 为 其 打分 : 对 于 目标 项 ， 根 据 推 攻击 或 核 攻击 ， 分 别 为 其 
打 高 分 或 低 分 ,在 均值 攻击 中 ,攻击 概貌 同样 没有 选择 填充 项 ; 


= 


用 12: 范 数 解析 结构 化 噪声 的 低 秩 矩阵 补 全 算法 ; Xiao 等 人 中 在 
低 秩 矩阵 补 全 问题 中 ， 对 于 采样 过 程 中 高 斯 噪声 在 矩阵 补 全 问 
题 中 产生 的 干扰 ， 使 用 了 和 矩阵 的 Frobenius 范 数 来 解析 高 斯 噪 
声 ， 提 高 了 算法 的 鲁 棒 性 ，Zhang ALOE 2D 图 像 特征 提取 
时 利用 Li 范 数 有 效 缓解 了 算法 对 于 噪声 敏感 的 问题 ; 汤 镇 宇 等 
人 0 在 基于 字典 求 取 稀 疏 系数 以 进行 人 脸 识别 的 过 程 中 利用 
了 Lz 范 数 正则 化 ， 使 算法 在 降低 复杂 度 的 同时 保持 了 较 高 的 识 
别 精度 。 

2 ”基于 属性 优化 结构 化 噪声 矩阵 补 全 的 抗 托 攻击 个 
性 化 推荐 算法 (SATPR) 


2. 属性 优化 结构 化 噪声 矩阵 补 全 模型 (AFMCSN) 
通常 在 推荐 系统 中 ，m 名 用 户 构 成 用 户 集 合 : U= 
{uUa Umh EER, n 件 物品 构成 物品 集合 : 1o oisi), 用 
户 - 物 品评 分 矩阵 可 表示 为 R eR" : 


A 
* on; * (1) 
* 7? 7 


其 中 : 用 户 1 对 物品 /的 评分 记 作 ny，“*” 表 示 已 知 评分 ,“? ” 


填充 项 随机 选择 物品 ， 其 分 值 不 再 根据 全 体 物品 平均 分 ， 而 是 
根据 对 应 物品 各 自 平 均 分 进行 打分 ， 对 于 目标 项 ， 根 据 推 攻击 
或 核 攻击 ， 分 别 为 其 打 高 分 或 低 分 。 在 流行 攻击 的 推 攻击 中 ， 

选择 填充 项 选择 最 流行 的 物品 打 高 分 ， 填 充 项 随机 选择 物品 ， 

根据 全 体 物品 平均 分 为 其 打分 ;对 目标 项 进行 推 攻击 打 高 分 。 
流行 攻击 的 核 攻击 形式 也 称 为 反 流行 攻击 ， 其 中 选择 填充 项 选 
择 最 不 受 欢 迎 的 物品 打 低 分 ， 填 充 项 同样 随机 选择 物品 ， 并 根 
据 全 体 物 品 平均 分 为 其 打分 ， 对 目标 项 进行 核 攻击 打 低 分 。 
此 可 见 ， 托 攻击 用 户 概 貌 通 常 进行 了 精心 设计 与 伪装 ， 

攻击 概貌 的 注入 将 极 大 改变 原本 正常 的 推荐 结果 。 因 此 ， 托 攻 
击 问题 引起 了 推荐 系统 领域 内 许多 研究 者 的 关注 。Zhang 等 人 
多 基于 用 户 概 貌 偏 离 度 ， 结 合 了 用 户 可 信和 度 与 物品 可 信和 度 ， 以 
可 信和 度 加 权 提 出 了 一 种 分 类 属性 ， 称 为 信任 加 权 的 平均 偏离 度 
(trust-weighted deviation from mean agreement, TWDMAO, H 
以 区 分 攻击 用 户 与 正常 用 户 ; Bryan 等 人 四 利用 Hv-score 度量 
对 用 户 进 行 排 序 ， 由 排序 后 的 用 户 概 貌 确定 攻击 目标 项 ， 在 获 


表示 未 知 评分 。 由 于 每 个 用 户 只 可 能 对 有 限 的 物品 进行 评分 ， 
而 每 件 物品 也 仅 可 能 收 到 有 限 用 户 的 评分 ， 故 这 个 评分 矩阵 通 
常 包含 大 量 的 空缺 评分 ， 是 一 个 稀疏 矩阵 。 推 荐 系统 的 目的 就 
是 预测 用 户 对 于 未 评分 物品 的 偏好 程度 ， 从 而 将 合适 的 物品 推 
荐 给 相应 用 户 。 

在 推荐 系统 中 ， 大 量 的 用 户 之 间 和 大 量 的 物品 之 间 必 然 存 
在 着 偏好 相近 的 用 户 和 属性 相近 的 物品 ， 这 种 相近 性 质 使 得 用 
户 -物品 评分 矩阵 往往 具有 近似 低 秩 性 505, 故 推荐 系统 问题 可 利 
用 低 秩 矩阵 补 全 技术 进行 评分 预测 。 用 尺 表 示 当 前 观察 到 的 评 
分 和 矩阵， 则 推荐 系统 问题 可 建 模 为 


min rank(X) st. P,(R)=P,(X) Q) 


其 中 :2 集合 表示 评分 矩阵 中 已 收 到 评分 的 元 素 下 标 集合 ，2 s 
{1,2 m} x {1,2 n} PO ÆRET. 表示 当 元 素 下 标 (i,j) e 4 时 ， 
得 到 对 应 位 置 采 样 元 素 : 
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本 rij(i,)) EN 
[Po (R)];; = f DEN 
6) 
但 是 ， 秩 函数 rank(CO 是 非 凸 的 ， 直 接 使 用 秩 函 数 建 模 得 到 
的 是 一 个 NP-Hard 问题 ， 其 计算 代价 会 随 着 问题 规模 的 扩大 而 
急剧 增 大 。 因 此 ， 往 往 将 秩 函 数 松弛 化 为 核 范 数 来 解决 此 问题 
[13] 
,到 各 XILPaCR) = Pa Qr 
D 
其 中 :Xl = EEEO o 为 矩阵 核 范 数 , qi 为 矩阵 X HIA i KA 
异 值 。 


在 实际 应 用 中 ， 推 荐 系统 往往 会 遭受 恶意 用 户 的 托 攻 了 
面 对 托 攻 击 和 干扰， 标准 矩阵 补 全 模型 的 推荐 精度 将 严重 降 1 
因此 ,为 了 保证 推荐 的 质量 ,有 必要 抵御 这 些 攻击 数据 的 影响 。 
通过 对 托 攻击 特点 进行 分 析 可 知 ， 托 攻击 的 目的 是 更 改 原来 自 
然 情况 下 的 评分 情况 ， 假 如 在 自然 情况 下 的 评分 情况 已 经 符合 
攻击 者 的 意图 ， 则 没有 进行 攻击 的 必要 ， 故 托 攻 击 用 户 的 评分 
与 自然 状态 下 正常 用 户 的 评分 存在 不 一 致 性 。 另 外 ， 托 攻击 用 
户 的 评分 通常 是 机 械 填充 的 ， 这 也 会 与 基于 兴趣 偏好 而 形成 的 
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正常 用 户 评分 具有 相 异 之 处 。 基 于 以 上 分 析 ， 本 文 将 用 户 -物品 
评分 矩阵 中 的 托 攻击 评分 建 模 为 结构 化 行 噪声 ， 这 些 结构 化 噪 


声 与 正常 用 户 评分 的 潜在 规律 相 违背 ， 打 破 了 评分 矩阵 的 近似 
低 秩 性 。 对 于 评分 矩阵 中 存在 的 结构 化 行 噪声 ， 可 利用 矩阵 Lz 
范 数 对 其 进行 解析 5 。 在 剔除 攻击 评分 之 后 , 再 进行 评分 预测 ， 
将 有 效 提 高 推荐 精度 。 此 时 ， 模 型 可 改进 为 

IXI + AllZilz; s-t.Po(R) = Po(X +Z) (5) 


min 
XZemmxn 


其 中 : IZllz, = DEN Ea AE Li 范 数 。 


此 外 ， 用 户 往往 会 出 于 情绪 波动 而 打出 不 太 精确 的 评分 ， 
为 了 平滑 评分 的 这 种 细微 波动 ,可 引入 矩阵 的 Frobenius 范 数 ， 
将 其 改写 成 罚 函 数 形式 : 


4,3, dll + AllZllo: * 7 E [P5 Qt + Z — R)l2 © 


其 中 : ||Xlls = [E2 XT i| ERER Frobenius 范 数 。 


正如 之 前 所 叙述 的 ， 评 分 和 矩阵 通常 是 稀疏 矩阵 ， 能 够 收 到 
的 评分 数 远 小 于 评分 和 矩阵 元 素 个 数 。 在 MovieLens 的 ml-20m 
数据 集中 ，138493 名 用 户 对 于 27278 部 电影 仅 有 20000263 个 
评分 ; 在 EachMovie 数据 集中 ，72916 个 用 户 对 1628 部 电影 仅 
进行 了 2811983 次 评分 。 基 于 稀疏 数据 求 取 高 维 未 知 和 矩阵 很 难 
确保 求解 的 准确 性 。 为 解决 数据 稀 玻 性 问题 03， 本 文 考虑 引入 
遇 性 特征 信息 , 将 简单 的 评分 矩阵 R 细 化 为 三 个 矩阵 的 乘积 R = 
A'XB, 其中，4 和 B 分 别 是 用 户 特 征 箱 阵 和 物品 特征 矩阵，A4 € 
R*xm，B e R*x**， 和 矩阵 列 向 量 分 别 是 用 户 特 征 向 量 和 物品 特征 向 
量 ， 即 量化 了 的 属性 信息 ; 和 矩阵 是 低 维 未 知 矩 阵 ，Xe R**%*。 
此 时 ， 模 型 可 改 为 
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||A"XBI||, + AliZll;, +Ê lPa(A"XB +Z- RM — (7) 


min 
Xxemkxk, Zegmxn 


然而 ， 由 于 rank(47XB) < min{rank(4)，rank(B)}， 即 只 要 特征 
JERE A 与 也 其 中 之 一 的 秩 足 够 小 ， 比 如 4 或 她 的 维度 过 小 ， 包 
含 信息 过 少 等 ， 则 无 论 和 矩阵 取 何 值 ， 乘 积 4XB 的 秩 都 必然 会 
更 小 ， 将 直接 满足 低 秩 条 件 。 为 避免 这 种 解 的 任意 性 ， 本 文 仅 
对 待 求 变量 X 进 行 低 秩 约 束 。 综 上 所 述 ， 属 性 优化 结构 化 噪声 
和 矩阵 补 全 (Attribution Facilitated Matrix Completion with 
Structural Noise，AFMCSN) 模型 可 建 模 为 


IXI. + AllZl, + IP; (ATXB-- Z— ROME (9) 


min 
Xemkxk, Zegmxn 


当 求 得 行 噪声 矩阵 Z 之 后 ， 便 可 据 此 排除 托 攻击 和 干扰， 获 
得 高 精度 的 评分 预测 结果 。 
2.2 AFMCSN 模型 的 优化 求解 


为 求解 AFMCSN 模型 ， 可 采用 分 块 坐标 下 降 算法 09， 通 
过 对 各 个 变量 交 蔡 最 小 化 得 到 最 优 解 。 为 了 进一步 方便 求解 ， 


本 文 引 入 变量 C 


令 C=47XB， 模 型 (8) 转换 为 
IXIL * AliZll;, +Ê [[P5CC + Z — R) ||} 


min 
XERKXK, c zegmxn 


s.t. C— ATXB-0 (9) 


] Frobenius 范 数 将 其 改写 成 如 函数 形式 : 
IX IL. + AllZll21 + 


同上 ， 利 


CZeRrmxn 


E |IPo CC - Z — R)I? + l.c — A XB (10) 
L,(X,Z, C) = liXIl. + XZ + 
P |l; (C +Z- R)I? + 1C — A7XBIIE (11) 
对 各 个 变量 交 蔡 最 小 化 ， 则 各 个 变量 的 迭代 更 新 公式 为 


X**! = arg min L, (X, Z*, CF) 
XemKkxk 


Z**!— arg min L,(X*5Z, C“) 

s min, Lp (12) 
C** = arg min L,(X**!, Z**!, C) 

cegmxn 


至 此 , 原 最 优化 问题 变 为 三 个 子 问 题 ， 分 别 对 应 X,Z,C 的 更 
新 。 
对 子 问题 1, 本 文采 用 近邻 前 向 后 向 分 裂 (proximal forward 


backward splitting, PFBS) 07 技术 对 其 进行 优化 求解 ， 令 : 


F,QO = |IXll, 
=£]|C — ATXBI (13) 
中 函数 F(X) 的 导数 为 
VF2(X) = p(AA"XBB" — ACB”) (14) 


为 简化 公式 ， 方 便 求解 ， 引 入 一 个 新 变量 也 9 

yk = X* — 8,VF,(X*) = X" 一 

其 中 ， 根 据 PFBS 规则 ， 
则 


6xp(AATXBBT 一 4CxB7) (15) 
引入 参数 gx 用 于 对 和 进行 迭代 更 新 。 


9xIIXIL. (16) 
根据 文献 [8]， 对 于 和 矩阵 了 e R** 和 常数 r > 0, 3 


X*9 = arg min i|[X — Y**!][2 + 
Xemkxk 2 


1 
Di(Y) = in izllX — YII? + TX, 
.Q)- arg min (IX -Yè lili.) (17) 


其 中 : Dr-( 切 是 奇异 值 阔 值 算 子 ， 若 矩阵 了 的 奇异 值 分 解 为 了 
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UZV7， 则 t 所 对 应 的 奇异 值 闵 值 算 子 为 Di(Y) = U * [sign(Y) 。 
max(|Y| — 7,0)] *+V 7， 其 中 符号 “o” 是 Hadamard 积 ， 表 示 两 
矩阵 对 应 元 素 相 乘 。 

因此 ， XX 的 更 新 可 按 如 下 步骤 迭代 进行 : 


y^: = (X* — 6xpAATXBBT — AC*B") 
Xr+1 = Ds (myt) (18) 
Xx 


2 m 
在 PFBS 中 ， 参 数 6 需 满足 0 < 6 CIS. WHR, LíX = 


amax(BB7) * amax(447) ， 故 参数 6x 需 满足 0<6x< 


2 mE ` 1 
amax(BBT)*amax(447)” 在 实验 中 本 文 取 6x amax(BBT)*amax(447)” 
对 于 子 问题 2， 类 似 于 XX 的 更 新 过 程 ， 令 
Fa(Z) = ĈIPA (C + Z — Rl (19) 
VF2(Z) = BPC - Z — R) (20) 


为 简化 公式 ， 方 便 求解 ， 引 入 一 个 新 变量 V， 令 
y**! = Zk — 6,VF,(Z¥) = Z* — 8, BP (C* + Z* — R) (21) 


则 Z^ = arg min =|Z — V^? lI + 6zAllZllo 22) 
Zemgmxn 


CLS] XIF Z 矩阵 内 每 一 行 ; 


key) — EE key) 
(Z**) ma 中 pe: (y**) 


i212,-,m 23) 
因此 ，Z 的 更 新 可 按照 如 下 步骤 迭代 进行 : 


" = Z* — 6, BP, C* + Z* — R) 


(Z*+1)® = v - t (y: i= 12,…,m (24) 


ózÀ 
ee] ,0 
2 


类 似 地 ,通过 计算 ,Ly_Z = B, 故 参数 6z 需 满足 0 < 6z <$, 


在 实验 中 ， 取 6z = s. 


对 于 子 问题 3， 仿 


F(C) = P |I; CC + Z — R)II£ + IIC — A"XBII Q5) 
RI di Q6) 
此 时 有 
VF(C) = BP5(C + Z — R) + p(C — ATXB) (27) 
4 VF(O) =0， 可 求 得 C 的 迭代 更 新 公式 : 
C**! = [pATX**! B + BP4(R — Z***)]/Co + p) (28) 


至 此 , 可 整理 得 到 AFMCSN 模型 的 求解 步骤 , 如 算法 1 所 


算法 1 属性 优化 结构 化 噪声 矩阵 补 全 算法 〈AFMCSN) 

输入 : 用 户 与 物品 特征 矩阵 4, B, 采样 评分 矩阵 R, 采样 下 
RERNA, BAe, p, AKIKRE Maxiter 

输出 : 结构 化 行 噪声 矩阵 Z 

1 initialize X? 20,29 = 0,C° = 0; 


2 for k-0 to Maxiter 
3 根据 式 (18) 更 新 X; 


en a a 
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4 根据 式 (24) 更 新 Z; 
5 根据 式 (28) 更 新 C; 
6 end for 

7  retum Z; 


其 中 ， 最 主要 的 算法 步骤 集中 在 3-5 步 ， 即 按照 式 
(18)(24)(28) 更 新 各 个 变量 。 在 用 户 数 为 m, 物品 数 为 ,属性 特 
征 向 量 长 度 为 + 的 情况 下 ， 分 别 考虑 式 (18)(24)(28) 的 时 间 复 杂 
E: 式 (18) 包 括 中 间 变 量 了 的 更 新 以 及 XX 的 更 新 。 在 更 新 了 的 
过 程 中 ， 需 要 进行 矩阵 连续 相 乘 的 操作 ， 其 时 间 复 杂 度 为 
O(mnk); 对 于 六 的 更 新 ， 需要 对 和 矩阵 了 进行 奇异 值 分 解 ， 其 时 
间 复 杂 度 为 O(K3); 式 (24) 包 括 中 间 变 量 的 更 新 以 及 z 的 更 
新 。 在 更 新 地 的 过 程 中 ， 主 要 是 矩阵 加 减 操作 ， 其 时 间 复 杂 度 
为 O(mn); 对 于 2Z 的 更 新 , 需要 逐 行 更 新 , 每 一 行 需要 进行 4 次 
相 乘 ， 其 时 间 复 杂 度 为 Omn); 式 (28) 对 应 c 的 更 新 ,其 中 主要 
的 计算 步骤 在 于 和 矩阵 相 乘 部 分 ， 其 时 间 复 杂 度 为 O(mnk) 
综 上 ， 算 法 1 的 总 时 间 复杂 度 为 O(Maxiiter*(mnk + mn + 
K3))， 其 中 计算 代价 较 大 的 部 分 在 于 和 矩阵 相 乘 操作 与 奇异 值 分 
解 操 作 。 对 于 和 矩阵 相 乘 ， 当 前 学 术 界 与 产业 界 已 经 提出 并 实现 
了 很 多 高 效 的 优化 算法 ， 以 本 实验 所 采用 的 MATLAB 平台 为 
例 ， 它 在 执行 矩阵 运算 时 可 使 用 Intel 的 Math kernel library 库 
(https://software.intel.com/en-us/mkl)， 从 底层 硬件 角度 进行 了 优 
化 ， 运 算 速 度 可 得 到 极 大 提高 。 而 和 矩阵 的 奇异 值 分 解 可 利用 
PROPACK 软件 包 (http://sun.stanford.edu/~rmunk/PROPACK)/)， 
首先 估计 和 矩阵 的 秩 x, 计算 过 程 中 仅 对 前 "个 最 大 奇异 值 以 及 对 
应 奇异 向 量 进行 计算 ， 即 将 时 间 复 杂 度 从 O(K3) 降 为 OCrk?)， 
能 够 在 降低 运算 代价 的 同时 保证 运算 精度 。 
2.3 SATPR 算法 
基于 AFMCSN 托 攻 击 检测 模型 ， 本 文 可 得 到 抗 托 攻击 的 
SATPR 算法 。 首先, SATPR 算法 需要 引入 代表 用 户 与 物品 属性 
特征 的 4 和 珑 阵 和 下 和 矩阵， 如果 数据 集中 已 经 提供 了 这 两 个 属性 
特征 矩阵 ， 便 可 直接 利用 ;但 更 常见 的 情形 是 ， 数 据 集 中 并 未 
直接 提供 这 两 个 特征 矩阵 。 此 时 需要 先 计算 用 户 间 相似 度 与 物 
品 间 相似 度 ， 再 利用 谱 聚 类 算法 分 别 构 建 用 户 与 物品 的 属性 特 
征 抢 阵 08。 在 推荐 系统 领域 ， 相 似 度 是 用 来 预测 用 户 评分 的 党 
用 工具 ， 多 种 相似 度 算法 均 可 应 用 于 属性 特征 矩阵 的 构建 。 在 
此 , 引入 Shi 等 人 09 提 出 的 HeteSim 相似 度 ,这 是 一 个 递归 定义 
的 相似 度 度量 ， 基 于 对 象 的 属性 信息 考虑 了 两 个 对 象 之 间 所 
可 能 产生 关联 的 元 路 径 ， 以 入 度 与 出 度数 量 衡量 彼此 之 间 的 影 
向 程度 ， 可 以 细致 地 表现 出 对 象 之 间 的 相似 性 。 
当 获 取 了 相似 度 信息 ， 便 可 利用 谱 聚 类 算法 ， 基 于 相似 度 
计算 属性 特征 矩阵。 首先 计算 拉 普 拉 斯 矩阵 的 特征 值 和 特征 向 
量 ， 取 前 《个 特征 向 量 组 成 矩阵 ， 每 一 行 即 可 视 为 对 应 样本 的 
遇 性 特征 向 量 ， 这 些 属 性 特征 向 量 之 间 的 相似 关系 可 以 恰当 反 
决 对 应 的 对 象 之 间 的 潜在 相似 程度 。 通 过 这 种 方法 ， 同 样 可 以 
获得 代表 属性 特征 的 矩阵 4 和 B. 
\ 备 了 必要 条 件 后 ， 便 可 利用 AFMCSN 模型 求解 结构 化 
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行 噪声 矩阵 Z， 然 后 根据 Z 矩阵 剔除 攻击 项 ， 再 利用 传统 推荐 
算法 进行 评分 预测 。 当 前 ， 针 对 无 托 攻击 评分 数据 集 已 经 有 了 
很 多 行 之 有 效 的 高 精度 推荐 算法 ， 但 在 托 攻击 数据 集 上 
传统 推荐 算法 往往 会 面临 性 能 下 降 的 问题 。 而 将 传统 推荐 算法 


, 这 些 
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precision-recall 
其 中 :TP 表示 判断 为 攻击 用 户 的 集合 中 , 真正 的 攻击 用 户 数量 ; 
FP 表示 判断 为 攻击 用 户 的 集合 中 , 被 误 判 的 正常 用 户 数量 ; FN 


结合 本 文 所 提出 的 AFMCSN 托 攻 击 检测 模型 ， 在 托 攻击 污染 
的 数据 集 上 将 同样 可 保证 评分 预测 的 鲁 棒 性 。 在 此 本 文采 用 Shi 
Chuan OSE pE H H SimMF 算法 进行 评分 预测 , 这 种 算法 基于 和 矩 


表示 判断 为 正常 用 户 的 集合 中 , 隐藏 的 攻击 用 户 数量 。precision 
越 高 说 明 所 找 出 的 攻击 用 户 确实 是 真正 的 攻击 用 户 的 可 能 性 越 
K, recall 越 高 说 明 真 正 的 攻击 用 户 被 检测 出 的 可 能 性 越 大 。F1 


阵 分解 ， 同 时 又 充分 利用 了 相似 度 信息 进行 加 权 ， 取 得 了 极 高 
的 预测 精度 。 
至 此 ， 可 整理 得 到 SATPR 算法 步 又， 如 算法 2 Bra. 

算法 2 基于 属性 优化 的 抗 托 攻击 个 性 化 推荐 算法 
(SATPR) 


] 户 与 物品 属性 信息 ， 采 样 评分 矩阵 R, REE FER 
SHIB, p, AU GIN TUO Maxiter。 

输出 : PUMVEZIOBEER. 

1 ”基于 用 户 与 物品 属性 信息 计算 用 户 相似 度 与 物品 相似 


m 
DP 
E 
w l 
EE 


2. 基于 相似 度 ， 利 |) 
性 特征 矩阵 A, B: 
3. 基于 属性 特征 矩阵 4，B， 利 用 算法 1 求解 结构 化 行 


j 谱 聚 类 算法 分 别 构建 用 户 与 物品 的 


4 ”根据 矩阵 Z 从 采样 评分 矩阵 吻 除 托 攻击 评分 ; 
用 传统 推荐 算法 进行 评分 预测 ， 求 得 预测 评分 矩阵 


3 ”实验 与 分 析 


3.44 数据 集 

本 文 实验 所 采用 的 数据 集 来 自 于 真实 的 Douban Book 数据 ， 
包含 了 1000 名 用 户 对 于 2000 本 书 的 32460 个 评分 。 值 得 注意 
的 是 ， 在 这 个 数据 集中 不 仅 有 用 户 对 于 书籍 的 评分 数据 ， 还 包 
括 用 户 的 属性 信息 以 及 书籍 的 属性 信息 。 对 于 书籍 来 说 ， 其 属 
性 信息 包括 四 类 : 作者 ， 书 名 ， 出 版 社 ， 出 版 时 间 ; 对 于 用 户 
来 说 ， 其 属性 信息 包括 三 类 : 群 组， 位 置 ， 好友。 由 于 属性 个 
数 相对 过 少 ， 将 通过 谱 罕 类 技术 构建 代表 用 户 与 书籍 属性 特征 
的 4 和 矩阵 和 她 矩阵 。 实 验 假定 数据 集中 原 有 的 用 户 均 为 正常 用 
P". 在 原 评分 矩阵 中 随机 选取 用 户 评分 行 ， 利 用 托 攻击 模型 生 
成 托 攻击 概貌 对 其 进行 蔡 换 ， 得 到 托 攻击 干扰 下 的 评分 数据 作 
为 实验 数据 集 。 
3.2 评价 指标 

从 托 攻击 用 户 检测 的 角度 来 看 ， 对 于 托 攻击 用 户 的 判断 可 
视 为 一 种 分 类 问题 , 对 此 , 常用 的 度量 标准 有 查 准 
查 全 率 (recall) 和 了 Fl 度量 。 


率 (precision )， 


TP 


precision = 一 一 一 一 (29) 
TP + FP 
recall = E (30) 
TP + FN 


度量 是 一 个 更 为 平衡 的 选择 ， 兼 顾 了 precision 5j recall 度量 ， 
Fl 度量 越 大 ， 说 明 检测 效果 越 精 确 。 
由 于 推荐 系统 问题 可 以 视 为 对 用 户 -物品 评分 和 矩阵 的 缺失 
评分 预测 问题 ， 因 此 从 和 矩阵 补 全 的 角度 ， 可 以 选用 平均 绝对 误 
差 (mean absolute error，MAE) 和 均 方 根 误差 (root mean square 
error，RMSE) 考 察 评 分 预测 的 精度 : 
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7 表示 测试 集 元 素 下 标 集合 ， 而 表示 用 户 i 对 物品 /的 预 


RMSE = (33) 


其 中 : 
测评 分 ，7j 表 示 用 户 i 对 物品 j 的 实际 评分 。MAE 与 RMSE 的 
值 越 小 ， 则 推荐 算法 对 评分 矩阵 中 缺失 评分 的 预测 精度 越 高 。 
3.8 实验 设计 与 分 析 
本 节 将 通过 实验 检验 SATPR 算法 在 托 攻 击 下 的 性 能 。 实 
验 中 对 评分 矩阵 分 别 施加 随机 攻击 ， 均 值 攻 击 和 流行 攻击 三 种 
最 常见 的 攻击 方式 ， 各 自 进行 推 攻击 与 核 攻击 ， 产 生 六 种 不 同 
的 攻击 类 型 。 在 各 攻击 类 型 下 分 别 施加 填充 率 为 10%, 20%, 
攻击 强度 为 5%，10% 的 一 系列 托 攻击 ,并 在 这 些 托 攻击 干扰 后 
的 评分 矩阵 上 进行 实验 。 这 里 的 填充 率 和 攻击 强度 是 描述 攻击 
规模 常用 的 两 个 统计 学 指标 CU， 填充 率 p 加 通常 用 于 描述 攻击 
概貌 的 结构 ， 定 义 为 
p^" = |{ 填 充 物品 }|/n (34) 
其 中 : {填充 物品 } 表 示 攻 击 概貌 中 除了 攻击 目标 之 外 所 填充 的 其 
余 物 品 构成 的 集合 , 表示 物品 总 数 。 而 攻击 强度 p"* 用 于 描述 


攻击 用 户 存 在 的 比重 ， 定 义 为 
p** = [ri P j|/| Ge RIP) (35) 
其 中 { 玫 击 用 户 } 表 示 托 攻击 用 户 构成 的 集合 ，{ 正 常用 户 } 表 示 正 常 


用 户 构 成 的 集合 ,|| 是 集合 的 势 , 在 此 处 表示 集合 中 元 素 个 数 。 

在 算法 中 所 涉及 的 参数 主要 有 BP,p,4, 其 取 值 可 以 通过 在 训 
练 集 上 采用 交叉 验证 的 方式 获得 。 本 文 设计 了 两 组 实验 。 第 一 
组 实验 从 托 攻击 用 户 查 找 的 角度 出 发 ， 检 验 SATPR 算法 在 各 
种 攻击 下 对 于 攻击 用 户 的 检测 能 力 ; 第 二 组 实验 从 评分 预测 的 
角度 进行 考虑 ， 检 验 SATPR 算法 在 各 种 攻击 模式 下 的 评分 预 
测 精度 。 

实验 1 SATPR 算法 检测 实验 

在 本 实验 中 ， 将 考察 各 种 攻击 下 SATPR 算法 对 于 托 攻击 
用 户 的 查 准 率 ， 查 全 率 以 及 Fl 度量 。 作 为 对 比 ,本 实验 分 别 考 
虑 了 加 入 属性 信息 前 与 加 入 属性 信息 后 ， 算 法 对 于 托 攻击 用 
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的 检 测 性 能 o 对 于 加 入 E 性 信 息 前 的 算 ix , 将 Fk w 作 表 5 流行 攻击 下 SATPR NoAttr 算法 的 查 准 率 , 查 全 率 和 F1 度量 


SATPR_NoAttr。 实 验 结果 如 表 1-6 所 示 。 put př" wusidow fecal Fl 
表 1 随机 攻击 下 SAIPR_NoAttr 算法 的 查 准 率 , 查 全 率 和 了 Fl 度量 10% 5% 0.7583 1.0000 0.8626 
p" př" precision recall Fl 1096 1096 0.8585 . 1.0000 0.9239 
10% 5% 0.7222 1.0000 0.8387 i 2096 5% 0.75511 — 0.9940 0.8557 
10% 10% 0.8667 1.0000 0.9286 20% 10% 0.8029 1.0000 0.8907 
Sm 204 5% 0.7979 0.9222 0.8556 10960 5% 0.8053 1.0000 0.8922 
20% 10% 0.8107 1.0000 0.8954 10% 1096 0.8750 — 1.0000 0.9333 
10% 5% 0.6947 1.0000 0.8198 diae 20% 5% 0.7746 0.9880 0.8684 
10% 10% 0.8750 1.0000 0.9333 20% 10% 0.7877 1.0000 0.8813 
ia 20% 596 . 0.7455 1.0000 0.8542 
20% 10% 0.8068 1.0000 0.8930 表 6 流行 攻击 下 SATPR 算法 的 查 准 率 , 查 全 率 和 了 1 度量 
pt pf" precision recall FI 
K2 随机 攻击 下 SATPR 算法 的 查 准 率 , 查 全 率 和 了 1 度量 10% 596 0.8273 1.0000 0.9055 
pes. p% precision recall Fl 10% 1096 0.989] 1.0000 0.9945 
10% 5% 0.7521 .0000 0.8585 nd 20% 5% 0.8883 1.0000 0.9408 
10% 1096 0.989] 1.0000 0.9945 20% 10% 0.9940 1.0000 0.9970 
a 20% 5% 0.8564 1.0000 0.9227 10960 596 0.8426 — 1.0000 0.9146 
20% 10% 0.9824 1.0000 0.9911 10% 10% 0.989] 1.0000 0.9945 
10% 5% 0.7647 1.0000 0.8667 J 20% 5% 0.9076 1.0000 0.9516 
10% 10% 0.9785 1.0000 0.9891 20% 10% 0.9940 1.0000 0.9970 
"e 20% 5% 0.8392 1.0000 0.9126 
20% 10% 0.9824 10000 09911 由 实验 结果 可 知 ， 攻 击 强度 与 填充 率 越 大 ， 托 攻击 用 户 越 
易于 检测 ， 反 之 将 会 出 现 一 定 的 误 判 。 究 其 原因 ， 由 于 托 攻 击 
表 3 均值 攻击 下 SATPR_NoAttr 算法 的 查 准 率 , 查 全 率 和 1 度量 通常 是 批量 注入 的 ， 当 攻击 强度 较 高 时 ， 这 种 隐 含 的 群体 性 特 
pet fil TEES. Fl 征 通常 会 有 助 于 连带 找 出 其 余 的 托 攻击 用 户 。 从 填充 率 来 看 ， 
10% 596 0.7339 1.0000 0.8465 当 填 充 率 较 高 时 ， 托 攻击 用 户 将 会 接近 更 多 的 正常 用 户 ， 相 比 
10% 10% 0.8750 1.0000 09333 之 下 也 越 容 易 暴 露出 托 攻 击 用 户 并 非 基于 兴趣 偏好 打分 而 产生 
Push 20% 595 0.7249 09940 0.8384 的 不 自然 性 ， 而 填充 率 较 低 时 ， 尚 未 能 根据 有 限 的 评分 表露 出 
20% 10% 0.7915 1.0000 0.8836 用 户 偏好 , 此 时 ,正常 用 户 与 托 攻击 用 户 的 评分 概貌 差别 不 大 ， 
10% 596 0.6047 — 1.0000 0.8198 因而 往往 会 导致 误 判 。 
10% 1096 0.8667 — 1.0000 0.9286 企 查 全 率 方面 ，SAIPR_NoAttr 算法 在 大 部 分 攻击 模式 下 
20% 5% 0.7523 1.0000 0.8586 基本 达到 了 10076, Tfj SATPR 算法 在 各 种 攻击 下 的 查 全 率 均 完 
20% 10% 0.8146 — 1.0000 0.8978 全 达到 了 100%。 但 在 三 准 率 方面 ， 二 者 均 未 能 达到 10096. 3X 
说 明 两 种 算法 基本 上 都 可 以 将 托 攻击 用 户 全 部 查找 出 来 ， 但 同 
RA 均值 攻击 下 SATPR 算法 的 查 准 率 , 查 全 率 和 F1 度量 时 会 将 一 些 正常 用 户 误 判 为 托 攻击 用 户 。 尽 管 如 此 ，SATPR $1 
pat yf precision recall Fl 法 在 各 种 攻击 下 的 检测 精度 均 优 于 SATPR. NoAttr 算法 。 在 Fl 
10% 5% 0.7398 — 1.0000 0.8505 度量 方面 ，SATPR_NoAttr 算法 仅 在 90% 左 右 ， 而 SATPR 算法 
10% 1096 0.989] 1.0000 0.9945 在 一 些 攻击 模式 下 一 度 接近 100%， 这 表示 几乎 没有 遗漏 也 没 
T -—P 有 误 判 。 实 验 结果 验证 了 加 入 属性 信息 的 有 效 性 。 
20% 10% 0.9882 1.0000 0.9940 实验 2 SATPR 算法 评分 预测 实验 
10% 596 0.7109 10000 08311 在 本 实验 中 ， 分 别 比较 了 三 种 推荐 算法 在 托 攻击 干扰 下 的 
109, 1096 dores- doodo Dogo 评分 预测 精度 : AA Ie IL AERE ERAD, 记 作 MF; 
Nuke t 第 二 种 算法 是 没有 采取 抗 托 攻击 措施 的 SimMF 算法 ， 第 三 种 
209, 1096 0.9882 1.0000 0.9940 算法 是 SATPR 算法 ,这 里 在 评分 预测 部 分 采用 了 SimMF 算法 ， 


是 AFMCSN 托 攻击 检测 模型 与 SimMF 算法 的 结合 。 实 验 结 
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BG 
如 表 7-12 所 示 。 表 11 流行 攻击 下 的 MAE fi 

表 7 随机 攻击 下 的 MAE 值 pt pf MF SimMF SATPR 

pt. gm MF SimMF SATPR 1096 596 0.6038 0.5724 0.4370 

10% 596 0.6178 0.5829 0.4735 10% 1096 0.6150 0.5892 0.3162 

10% 1096 0.6050 0.5740 0.3139 ad 2006 5% 0.6206 0.5828 0.4366 

did 20% 5% 0.6268 0.5840 0.4736 20% 10% 0.6124 0.5841 0.2921 

20% 10% 0.6067 0.5757 0.3347 10% 5% 0.6009 0.5737 0.4359 

10% 5% 0.6165 0.5751 0.4701 10% 10% 0.6032 0.5780 0.3091 

10% 10% 0.6001 0.5707 0.3362 ii 2096 5% 0.6247 0.5857 0.4517 

ne 20% 5% 0.6296 0.5864 0.4831 20% 10% 0.6184 0.5881 0.2930 
20% 10% 0.6045 0.5757 0.3301 


R12 流行 攻击 下 的 RMSE 值 


表 8 随机 攻击 下 的 RMSE 值 p^ yf MF SimMF SATPR 
put fü MF SimMF SATPR 10% 596 0.7898 0.7171 0.5865 
1096 596 0.7984 0.7276 0.6388 10% 1096 0.8086 0.7430 0.4274 
Push 
10% 1096 0.7862 0.7213 0.4240 2096 596 0.8178 0.7367 0.6428 
Push 
2096 596 0.8216 0.7349 0.6584 20% 1096 0.7889 0.7274 0.4092 
20% 10% 0.7871 0.7243 0.5412 10% 5% 0.7803 0.7250 0.5917 
10% 5% 0.8051 0.7293 0.6558 10% 10% 0.7897 0.7352 0.4204 
Nuke 
10% 10% 0.7826 0.7197 0.5084 20% 5% 0.8188 0.7412 0.6779 
Nuke 
20% 5% 0.8244 0.7398 0.6853 20% 10% 0.8138 0.7455 0.4138 
20% 10% 0.7919 0.7313 0.5154 
tas 由 实验 结果 可 知 ， 注 入 攻击 概貌 后 会 降低 推荐 精度 ， 在 相 
表 9 均值 攻击 下 的 MAE 值 同 的 填充 率 下 ， 攻 击 强 度 增 大 会 导致 MAE 与 RMSE 值 变 大 。 
m pat "s MF SimMF SATPR 然而 ， 在 很 多 攻击 模式 下 ， 相同 的 攻击 强度 ， 填充 率 越 高 ， MAE 
P 后 而 会 恋 EL Tr dz y 2). xs p ipa 
HH E 3r 4 E, E A AK VAN nis n s 
I. HL EMO. cse — mies 用 户 而 注入 的 ， 因 此 填充 项 是 符合 原始 数据 分 布 规律 的 ， 更 多 
Push d ~ 意味 着 IER Hj žr dg s nnt. 
"m 的 填充 项 也 意味 着 更 多 的 正常 数据 ， 反 而 提升 了 数据 集 的 鲁 棒 
性 mz. £ 过 少 很 难 影 目标 用 广 
20% 10% 0.6171 0.5833 0.3102 性 。 但 对 攻击 者 dE UU 真 充 项 过 人 少 , 又 很 难 影响 到 EN EH JS 
V1 HE 382 14: E. "3H ESK SaRGGRPEE SEHE T 
ek 的 推荐 结果 ， 从 而 无 法 达到 攻击 意图 。 为 应 对 精心 设计 的 托 攻 
3 d FR IM ee H AME E ZZ r 
10% 10% 0.5967 0.5672 0.3148 击 注入 模式 ， 对 应 的 抗 托 攻击 策略 e s EET ST 分 析 。 
Nuke Z> rem Y : ^er yE tp 66 38 44? EH A Ri 
SUE cie eee GNE. dus 在 三 种 推荐 算法 中 , SimMF 算法 的 性 能 要 优 于 基本 的 矩阵 
p: 74 y "HT El 1 N P4 MJ REGJEZT a 一 
20% 10% 0.6150 0.5821 0.3397 分 解 算法 , 可 见 SimMEF 算法 充分 利用 了 相似 度 进行 加 权 , 在 
定 程度 上 降低 了 推 攻击 的 干扰 。 然 而 ，SATPR 算法 取得 了 最 优 
表 10 均值 攻击 下 的 RMSE 值 的 性 能 ， 在 各 种 攻击 模式 下 ， 均 得 到 了 最 小 的 MAE 与 RMSE 
pt "s MF SimMF SATPR 值 ， 这 证 明 了 SATPR 算法 在 托 攻 击 下 的 鲁 棒 性 。 
10% 5% 0.8017 0.7313 0.4194 4 结束 语 
= A 
10% 10% 0.7837 0.7268 0.6063 
Push ELEA i £n Ws t = ùg gi Ek 品 
RAR 本 文 针对 个 性 化 推荐 系统 面临 的 托 攻击 问题 ， 从 结构 化 噪 
者 dox HE y Sa 4 SE Z M zE 2J- > = o 
—"— X cn 声 矩 阵 补 全 角度 出 发 ， 将 托 攻 击 用 户 评分 建 模 为 干扰 了 自然 状 
A REZE [UE T 4l HME m ek KA 4T l Il 35 Xx 
cc 态 下 评分 矩阵 近似 低 秩 性 的 结构 化 行 噪声 ,并 利用 124 范 数 对 这 
s HZA HITR Tr e ps] Rs da 8 
"-— oae ar Aaa 些 托 攻击 评分 进行 解析 。 此 外 ， 本 文 在 攻击 检测 过 程 中 融入 
Nuke 户 与 物品 的 属性 特征 信息 ， 提 出 Me Le E KM Vh s REX 
idu. qu gemens MR Uma 与 物品 的 属性 特征 信息 ， 提 出 了 属性 优化 结构 化 噪声 矩阵 补 
刑 | Ho? 十 检 BEA rp H LH HH 
209, 10% 0.8033 0.7385 0.5209 全 模型 ， 提 高 了 攻击 检测 精度 。 最 后 ， 本 文 基于 所 提出 的 
AFMCSN 托 攻击 检测 模型 , 改进 了 传统 的 不 具备 抗 托 攻击 能 力 


的 推荐 算法 ， 提 出 一 种 基于 属性 优化 矩阵 补 全 的 抗 托 攻击 个 性 


录用 稿 
化 推荐 算法 。 实 验 结 果 证 明 ， 在 托 攻 击 干扰 下 ，SATPR 算法 依 
旧 可 以 产生 鲁 棒 的 评分 预测 结果 ， 在 推荐 系统 的 实际 应 用 中 具 
有 现实 意义 
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